查看原文
其他

国产中文大语言模型 “天河天元” 发布,涉及各种小说、古文、百科、新闻、中医、法律等!

出品 | OSC开源社区(ID:oschina2013)

国家超算天津中心在第七届世界智能大会上发布了天河百亿亿级智能计算开放创新平台和国产中文大模型 —— 天河天元。
中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,训练打造了自己的中文语言大模型 —— 天河天元大模型。
天河新一代超级计算机实现了从硬件到软件环境全面自主的信息技术应用创新,官方也在展区展示了天河新一代超级计算机上采用的计算芯片、主板等核心技术。
据悉,“天河 E 级智能计算开放创新平台” 将带来突破百亿亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。
未来,国家超算天津中心还将在 “天河天元大模型” 的基础上启动深度训练面向医疗、工业、法律等领域的专业模型。未来大模型将在深度学习平台的支撑下成为产业智能化基座。


往期推荐


X.Org已死,Wayland长存
Go错误处理仍是开发者的“头号挑战”
10余款开源静态站点生成器,构建属于自己的网站从未如此轻松!



🌟 活动推荐
2023 年 5 月 27-28 日,GOTC 2023 全球开源技术峰会将在上海张江科学会堂隆重举行。
为期 2 天的开源行业盛会,将以行业展览、主题发言、特别论坛、分论坛、快闪演讲的形式来诠释此次大会主题 ——“Open Source, Into the Future”。与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及 OSPO、汽车软件、AIGC、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。
长按识别下方二维码立即查看 GOTC 2023 详情/报名。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存